开篇语

CCF 数图经过多年的积累和发展,具备一定规模,目前具有的资源主要有论文、视频、PPT讲稿以及图片、报告等,涉及计算机各个领域,内容不可谓不丰富。面临的主要问题是资源的语义结构不是很清晰,会员查找结果不是很对路。为此学会特成立CCF 数图编审委员会,发挥专家学者的作用,促使学会数图的资源建设在保证质量的基础上更好地满足广大会员的需求,借助数字化手段更好地服务大家。此次推出的CCF数图焦点(CCF DL Focus)是编审委成立以来第一项举措,意图是由领域专家(主要是CCF专委组织)针对数图资源编辑梳理出符合本领域发展趋势的专题资源系列,解决数图资源语义结构不清楚的问题,更好地满足会员的查看需要。本期主题是体系结构,由编委武成岗老师带领体系结构专委的委员一起加工整理的智能计算系统专辑,开了一个好头!后续数图编审委员会将在此基础上组织推出更多主题专辑,以飨读者!我们也希望有更多的会员加入这一活动,组织出更多的丰富多彩的“数图焦点”,充分发挥学会“由会员构成(of the Membership)、由会员治理(by the Membership)、为会员服务(for the Membership)”的“3M”理念 ,让CCF数图深入人心!
——孟小峰(CCF数图编审委员会主任)

本期摘要

近年来,日益普及的互联网产生了大量的数据,新型体系结果的发展带来了巨大的算力,在二者的加持下人工智能得以飞速发展和广阔应用,人类社会正式进入AI+时代。中国工程院院士、CCF名誉理事长李国杰研究员在2017年就曾振臂高呼《改变“头重脚轻”的学科现状》,尖锐地指出了我国计算机科研和产业的弊端是“头重脚轻,消费侧强供给侧弱,核心技术缺失”。呼吁计算机学者在计算机体系结构等传统学科方向潜心研究。

如何让历史悠久的计算机体系结构学科重新焕发活力?这是包括体系结构研究学者在内的全体计算机专家学者们都应该认真思考的问题。

CCF体系结构专委会整合CCF数字图书馆的内容,推出本次《智能计算系统》专题。将体系结构与人工智能相结合,可以有效填平计算机硬件与应用需求之间的性能差距,为体系结构学科的发展指明了新的方向。本次专题从不同视角组织了8篇文章或视频。试图简单勾勒出智能计算系统的发展概况,为体系结构的深入研究抛砖引玉。

目录

资料格式

改变“头重脚轻”的学科现状

我国计算机科研和产业的弊端是“头重脚轻,消费侧强供给侧弱,核心技术缺失”。计算机产业像一颗大树,必须扎根在系统结构和软件理论的深土中。

格式:
文章
计算机体系结构四个时代的结束和第五个时代的兴起

自从第一台电子计算机问世以来,大约65年过去了。前三代计算机已经成为过去,而以多核通用微处理器为主的第四代计算机正处于衰败期。摩尔定律的放缓和丹尼德缩放的终结,使通用微处理器40年的统治走向终结。为什么底层技术的这些变化无法克服?我们如何设计计算机来提高性能,特别是对于像机器学习这样计算要求很高的任务?

格式:
文章 视频 PPT
人工智能芯片与系统的现状与趋势

从硬件和芯片发展历程,讲解了为什么要做深度学习加速器的研究与产业化。从而引出提高芯片能量效率的三种方式:尺寸微缩、硬件加速、新器件新计算模式,并简述了人工智能芯片的发展趋势。在通用CPU芯片方面,我们与国际先进技术差距较大,不过他统计现在几乎所有的系统厂商都在做自己的人工智能芯片,在这一领域我们与世界先进技术差距较小。

格式:
视频
深度学习处理器

深度学习是最重要的人工智能方法之一。然而传统的CPU和GPU芯片在进行深度学习处理时遇到了严重的性能和能耗瓶颈。为此,我们设计了国际上首个深度学习指令集,和Inria合作设计了国际上首个深度学习专用处理器架构。今天,深度学习处理器已经成为国际学术界和产业界关注的热点。数以亿计的深度学习处理器已经应用在各种智能手机、智能摄像头、智能服务器中。我们在报告中将介绍深度学习处理器的研究背景、研究历史、主要技术挑战和应对策略。

格式:
视频
基于Chiplet的处理器体系结构

机器人处理器是一个全新的芯片种类,他需要支持机器人应用所涉及到的主要功能的加速。 机器人处理信息的流程,可以抽象为感知 - 判定 - 决策 - 行动四个步骤,我们提出了 Dadu、Dadu-P、 77 Dadu-CD 等多种异构并行架构,加速机器人上运行的核心处理步骤,并在国际上率先研制了 Dadu 系 列机器人处理器芯片,实现了核心算法的加速。并探索使用芯粒集成的方法,快速扩展芯片功能,降 低芯片设计周期和制造成本。

格式:
视频 PPT
面向处理器体系结构的智能算法并行优化技术

微处理器体系结构是CPU生态的关键技术,针对特定体系结构进行软件优化体现了体系结构平衡设计的核心思想,是体系结构研究的一个重要方面。本报告将重点围绕智能算法,介绍单核处理器优化,多核处理器并行优化技术,存储优化等技术,通过具体案例展现软件优化提升性能的潜力。最后,讨论软件并行优化面临的问题和挑战。

格式:
PPT
AIPerf:大规模人工智能算力基准测试程序

随着人工智能在各个应用领域上的快速普及以及大规模计算系统的大发展,公众需要一个简单有效的指标来帮助判断系统的人工智能算力。传统的高性能计算机评测方法和体系与当前人工智能需求的性能并不完全一致,而目前的人工智能基准程序又不足以支持上千加速卡级别大规模计算系统的评测。针对以上问题,本团队提出AIPerf,一种基于自动学习的可变规模人工智能基准评测程序。第一届AIPerf榜单已经于第二届中国超级算力大会ChinaSC2020上公布,目前已经支持至少四千加速卡级别的大规模计算系统的人工智能算力有效评测。

格式:
文章
一个研究人工智能的外行看计算机体系结构

此资料来自YEF2021大会论坛“青科看未来——计算机体系结构的新黄金时代”视频(45分21秒起)。本论坛邀请了中国计算机学会历届青年科学家奖从事相关领域的获得者进行研讨。讨论如何设计新一代的处理器体系结构、如何高效发挥底层系统算力、改进智能计算系统的框架,以及提升人工智能应用的持续性能等话题,并畅想未来人工智能应用对计算机体系结构会带来哪些新的挑战和需求。

格式:
视频 PPT

往期回顾

本期编委成员

武成岗

CCF体系结构专委主任
中科院计算技术研究所

沈立

国防科技大学

王毅

深圳大学

按姓氏拼音排序

杜子东

中科院计算技术研究所

冷静文

上海交通大学

马胜

国防科技大学

王超

中国科技大学